Étude de l'interaction entre variables pour l'extraction des règles d'influence
نویسندگان
چکیده
Résumé. Cet article présente une méthode efficace pour l’extraction de règles d’influence quantitatives positives et négatives. Ces règles d’influence introduisent une nouvelle sémantique qui vise à faciliter l’analyse d’un volume important de données. Cette sémantique fixe la direction de la règle entre deux variables en positionnant, au préalable, l’une comme étant l’influent et l’autre comme étant l’influé. Elle permet, de ce fait, d’exprimer la nature de l’influence : positive, en maximisant le nombre d’éléments en commun ou négative, en maximisant le nombre d’éléments qui violent l’influé. Notre approche s’appuie sur une stratégie qui comporte cinq étapes dont deux exécutées en parallèle. Ces deux étapes constituent les étapes clé de notre approche. La première combine une méthode d’élagage et de regroupement tabulaire basée sur les tableaux de contingence. Cette dernière construit et classe les zones potentiellement intéressantes. La seconde, injecte la sémantique et évalue le degré d’influence que produirait l’introduction d’une nouvelle variable sur un ensemble de variables en utilisant une nouvelle mesure d’intérêt, l’Influence. Cette étape vient affiner les résultats de la première étape, et permet de se focaliser sur des zones valides par rapport aux contraintes spécifiées. Enfin, un système de règles d’influence jugées intéressantes est construit basé sur la juxtaposition des résultats des deux étapes clé de notre approche.
منابع مشابه
Usage des mesures pour la génération des règles d'associations
Résumé. L’analyse en ligne (OLAP) fournit aux utilisateurs une navigation interactive des données multidimensionnelles. Cependant, aucun moyen pour expliquer les corrélations existantes entre les données n’est offert. Ainsi, le couplage de l’OLAP et de la fouille de données, plus particulièrement les règles d’association a efficacement apporté une solution satisfaisante à ce problème. Dans ce c...
متن کاملTypicalité et contribution des sujets et des variables supplémentaires en Analyse Statistique Implicative
Résumé. L’analyse statistique implicative traite des tableaux sujets x variables afin d’extraire règles et métarègles statistiques entre les variables. L’article interroge les structures obtenues représentées par graphe et hiérarchie orientés afin de dégager la responsabilité des sujets ou des groupes de sujets (variables supplémentaires) dans la constitution des chemins du graphe ou des classe...
متن کاملUn outil pour la visualisation de relations entre gènes
La reconstruction de réseaux de gènes à partir de données d’expression a suscité depuis quelques années un intérêt croissant. L’objectif est de proposer des interactions probables entre les gènes, qui pourront être ensuite plus profondément validées avec des expérimentations plus poussées. Plusieurs approches ont été proposées pour inférer ces réseaux de gènes comme les réseaux booléens ou l’an...
متن کاملLa Fragmentation Horizontale Revisitée: Prise en Compte de l'Interaction de Requêtes
Résumé. La principale caractéristique des requêtes définies sur un entrepôt de données relationnel (EDR) est le fait que leurs jointures passent systématiquement par la table des faits. Cette situation favorise l’interaction entre les requêtes. Cette interaction a été largement exploitée par les algorithmes d’optimisation de requêtes dans les bases de données traditionnelles, connue sous le nom...
متن کاملUne comparaison de certains indices de pertinence des règles d'association
Résumé. Cet article propose une comparaison graphique de certains indices de pertinence pour évaluer l'intérêt des règles d'association. Nous nous sommes appuyés sur une étude existante pour sélectionner quelques indices auxquels nous avons ajouté l'indice de Jaccard et l'indice d'accords désaccords (IAD). Ces deux derniers nous semblent plus adaptés pour discriminer les règles intéressantes da...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2008